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Rekombinante Altemaria alternate Allergene 

Die Erfindung bezieht sich auf rekombinante DNA Molekule, die fur 
Polypeptide kodieren, die die Antigenitat der Allergene Alta53, Alta22 und Altai 1 
besitzen, oder fur Peptide, die mindestens ein Epitop dieser Allergene aufweisen. 

5 Die genannten Allergene von Altemaria alternata, sowie die von den cDNA- 
Primarsequenzen dieser Allergene abgeleiteten Peptidsequenzen fiihren bei 
Pilzallergikern zu einer pathologischen Immunantwort mit einem Uberschieflen von 
IgE-Antikorpern. Rekombinante Allergene bzw. immunogen wirkende Teilpeptide 
konnen neben einer verbesserten Diagnostik auch zu einer in vivo oder in vitro 
Induktion einer Immuntoleranz bzw. Anergie von T-Lymphozyten Verwendung 

10 finden. 

Allergien nehmen nach epidemiologischen Untersuchungen in den letzten 
Jahren an Haufigkeit zu. Die Ursachen der allergischen Krankheiten sind vielfaltig. 
Allergene wie Pollen, Tierhaare und Exkremente von Hausstaubmilben sind heute 
wohl jedem schon eine Begriff (Wuthrich 1991, Miyamoto 1992). Schimmelpilze 
lassen aber fiir Fachleute hinsichtlich ihrer biologischen und allergologischen 

15 Bedeutung viele Fragen of fen. Es sind nicht zuletzt die aufierst grofle. Variability und 
Adaptionsfahigkeit auf unterschiedliche Lebensbedingungen, die die 
Forschungsarbeit mit diesen Pilzen erschweren. 98% der bekannten Pilze sind 
Landbewohner. Fur die meisten Pilze stellen klimatische Verhaltnisse mit einer 
Luftfeuchtigkeit von 80% und Temperaturen urn 20°C ideale Lebens- und 
Fortpflanzungsbedingungen dar. 

20 Die Mechanismen bei Schimmelpilzallergien sind nicht genau bekannt und 

scheinen komplexer und komplizierter als bei iiblichen Inhalationsallergien vom 
Soforttyp zu sein. Moglichkeiten einer Sensibilisierung uber den Verdauungstrakt 
und nicht nur uber den Respirationstrakt werden diskutiert und sind Gegenstand 
intensiver Forschungsarbeit. 

Allergien vom Soforttyp (Typl-Allergie) werden durch IgE Antikorper 

25 ausgelost, die Effektorzellen (Mastzellen des Schleimhaut- und Bindegewebstypus 
sowie Basophile Granulozyten des Blutes) mit ihren Fc-Teil iiber Rezeptoren 
kontaktieren und bei Allergenkontakt zu einer Freisetzung von Entzundungsstoffen 
(Histamin, Heparin, Arachidonsauremetaboliten etc.) fiihren (Roitt 1991, Klein 
1990). Die Bildung soldier IgE-Antikorper erfolgt durch B-Lymphozyten, die durch 
losliche Stoffe (Lymphokine), die von aktivierten T-Lymphozyten sezerniert werden, 

30 zur Sekretion der Antikorper stimuliert werden (Parronchi et al. 1991). 
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Am Beginn jeder Immunantwort stehen Zellen, die vorhandenes Antigen aktiv 
phagozytieren. Aus diesem Grund werden diese Zellen auch "FreBzellen" genannt. 
Es handelt sich hierbei um dendritische Zellen aber auch urn Monozyten, die im 
spateren Stadium zu Makrophagen differenzieren. Alle diese Zellen besitzen die 
Fahigkeit der DIAPEDESE, was ihnen ermdglicht, das Blutsystem zu verlassen und 
5 in Korperhohlraume etc. vorzudringen. Den Hauptanteil der Antigenvernichtung 
tragen die Makrophagen. Sie zerlegen das Antigen nach der Phagocytose in 
hochimmunogene Peptide (Durchschnittsgrofie ca. 15 Aminosauren) und prasentieren 
diese zusammen mit dem auf den Makrophagen exprimierten MHC-Proteinen (major 
histocompatibility), den T-Lymphocyten. Die zentrale Rolle der T-Lymphocyten 
wird an diesem Punkt unterstrichen. Nur an diesem Punkt der Immunantwort kann 

10 unterschieden werden, und das ist die zentrale Rolle der T-Lymphozyten, ob das 
dargebotene Antigen "fremd" Oder "eigen" ist. Erfolgt hier die Entscheidung 
"fremd", so steht der weiteren Bekampfung des Antigens nichts mehr im Wege. Die 
Erkennung des Fremdproteins im Kontakt mit eigenem MHC fuhrt zur weiteren 
Differenzierung der T-Lymphozyten zu Plasmazellen, die schliefilich Interleukine 
sezernieren. Diese Interleukin-Sekretion fiihrt zur Aktivierung von B-Lymphozyten, 

15 die ihrerseits das losliche Antigen erkannt haben, aber erst die "Mitteilung" der 
T-Lymphozyten fiber die Interleukine fur die eigene Differenzierung benotigen. Es 
folgt die Differenzierung der B-Lymphozyten zu Plasmazellen, wo nun beim 
Atopiker grofiere Mengen Antikorper der IgE-Klasse sezerniert werden. 

Wurde noch auf T-Zellebene das Antigen als "eigen" erkannt, wird die 
Immunantwort unter normalen Umstanden an diesem Punkt abgebrochen. Die 

20 komplexe Regulationskaskade des Immunsystems birgt jedoch eine Menge moglicher 
Fehler in sich. Zeuge dieses Umstandes sind die vielen, meist todlich verlaufenden, 
klinischen Falle von Autoimmunkrankheiten, bei denen das korpereigene 
Immunsystem nicht zwischen M selbst" und "nicht-selbst" unterscheiden kann. . 

Bis zum heutigen Zeitpunkt ist die Diagnose und somit auch die Therapie von 
allergischen Erkrankungen nicht zufriedenstellend. Die molekulare Charakterisierung 

25 der Hauptallergene von Alternaria mittels cDNA-Klonierung, Sequenzierung, 
Sequenzvergleich des allergenen Proteins mit Proteindatenbanken, sowie die 
Produktion von rekombinanten Allergenen wird mehr Aufschlufi fiber die in vivo 
Funktion der Proteine geben, die die falschen Immunreaktionen ausldsen. Diese 
Informationen sind aus folgenden Grfinden interessant: 

1) Hochreine rekombinante Allergene konnen fur eine sorgfaltigere Diagnose, 

30 besser als es heute mit Rohextrakten moglich ist, herangezogen werden. 
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2) Die Sequenz der Allergene wird dabei helfen, tolerogene Peptide zu 
definieren und eventuell auch den "IgE-Class-switch", der bei der Immunisierung 
mit dem Allergen passiert, verstehen zu lernen. 

Seit Jahrzehnten werden IgE bedingte Allergien, so z.B. auch Allergien gegen 
Pilzsporen, durch Hyposensibilisierung therapiert (Bousquet et al. 1991). Diese 
5 Therapie besteht in der Zufuhr von Allergenextrakten in Form von Injektionen Oder 
peroraler Applikation in wassriger Form als Tropfen in steigender Dosierung, bis 
eine Erhaltungsdosis uber mehrere Jahre erreicht ist. Resultat dieser Therapie ist das 
Erreichen einer Toleranz gegenuber den eingesetzten Allergenen, was sich in einer 
Abnahme der Krankheitssymptome auflert (Birkner et al. 1990). Das Problem bei 
dieser Art der Behandlung liegt in der Vielzahl der dadurch auftretenden 

10 Nebenwirkungen. Bei der Hyposensibilisierungstherapie sind Falle von 
anaphylaktischem Schock wahrend der Behandlung aufgetreten. Das Problem hierbei 
liegt in der schweren Standardisierbarkeit der Pilzprotein-Isolate. Bei einem Einsatz 
von Allergen-abgeleiteten, aber nicht anaphylaktisch wirkenden Peptiden, konnten 
risikolos hohere Dosen verabreicht werden, wodurch eine wesentliche Verbesserung 
der Hyposensibilisierung erreicht werden kann. 

15 Alternaria alternata ist praktisch uberall in der Natur anzutreffen. Beliebte 

Standorte, bzw. Lebensraume des Pilzes sind . verschiedene Bodentypen, 
Getreidesilos, verottetes Holz, aber auch lebende Pflanzen, Kompostplatze und 
Vogelnester. Findet man auf Tomaten schwarze Flecken, so ruhren auch sie mit 
grofler Wahrscheinlichkeit von Alternaria her. Aber nicht nur in freier Natur ist 
Alternaria alternata anzutreffen. Sehr haufig findet man den Pilz in feuchten 

20 Innenraumen und an Fensterrahmen. Warme Temperaturen und hohe 
Luftfeuchtigkeit begunstigen das Wachstum des Pilzes im allgemeinen. 

Man zahlt heute Alternaria alternata zu den wichtigsten Allergie auslosenden 
Pilzen, Yunginger et al. (1989) charakterisierten die erste allergene Fraktion und 
isolierten das erste als Allergen wirkende Protein Altai. Ein groBes Problem bei 
Alternaria alternata ist die Variationsbreite des Pilzes: Variationen im Proteinmuster 

25 aber auch variable Potenz der Allergieauslosung sind des ofteren beschrieben 
worden. Nyholm et al. (1983) zeigten, dafl es sich bei Agl und AIM um dasselbe 
Allergen handelt, dafl aber in unterschiedlichen Stammen von Alternaria alternata 
eine Variationsbreite des Proteins moglich ist. Der Reviewartikel von Budd (1986) 
beschreibt die Isolierung des allergenen Proteins AIM, nun Altai. Vollstandige 
cDNA Sequenzen von allergenen Proteinen von Alternaria alternata sind bis heute 

30 nicht publiziert worden. Verschiedene Studien zeigen jedoch starke Kreuzreaktionen 
zwischen Alternaria alternata, Stemphylium und Curvularia (Agarwal 1982). 
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ErfindungsgemaB werden Rekombinante DNA Molekiile der eingenags 
geannten Art geschaffen, die Nucleinsauresequenzen aufweisen, die mit dem 
Sequenzen 1, 3-5, 7-9 sowie 12 und 13, oder mit Teilbereichen dieser Sequenzen in 
homologer Weise iibereinstimmen, bzw. Nucleinsauresequenzen, die mit den 
genannten Sequenzen unter stringenten Bedingungen hybridisieren. Die DNA 
5 Molekiile konnen auch Nucleinsauresequnzen aufweisen, die durch Degeneration aus 
den vorgenannten Sequenzen ableitbar sind. 

Weitere Merkmale des Erfindungsgegenstandes gehen aus den nachstehenden 
Darlegungen hervor. 
Beispiele: 

a) Beschreibung der allergenen Proteine von Alternaria alternata mittels 

10 Western-Blotting 

Fur die Klonierung der vorliegenden Allergene von Alternaria alternata 
standen 142 Patientensera zur Verfugung. Urn die Reaktivitat der Patienten mit 
Pilzproteinextrakt zu testen, wurde Alternaria alternata (Sammlung Prof. Windisch 
Berlin Nummer: 08-0203) auf festem Medium (2% Glukose, 2% Pepton, 1% 
Hefeextrakt) geziichtet. Fiir die Proteinextraktion wurde die Pilzmatte nach 3 Tagen 

15 Wachstum bei 28°C abgezogen und mit flussigem Stickstoff aufgebrochen. Die 
Auftrennung der extrahierten Proteine erfolgte auf einem denaturierenden 
Polyacrylamidgel, das anschlieflend geblottet, mit Patientenserum inkubiert und mit 
l25 I-markiertem anti human IgE detektiert wurde. In Prozentzahlen ausgedruckt 
reagierten die Patienten auf die allergenen Proteine wie folgt: 

20 Alta53 44,8% 

Alta22 3.4% 
Altall 10,3% 

Wurde Protein aus gekauftem Pilzmaterial der Firma Allergon (Schweden) 
isoliert und fiir den Immunblot verwendet, konnte nahezu dasselbe Bandenmuster 
25 detektiert werden. Wie aus diesen Zahlen ersichtlich ist, handelt es sich bei Alta53 
urn ein Haupt-, bei Alta22 und Altall urn ein Nebenallergen. 

Figur 1 zeigt einen Uberblick iiber das zur Klonierung der beschriebenen 
Allergene zur Verfugung gestandene Patientenspektrum. Das Bild zeigt ein 12,5 
%iges Polyacrylamidgel. Die Patienten mit der Nummer 35 und 40 (es handelt sich 
hier auch urn die Patienten die fiir das spatere Screenen verwendet wurden) zeigen 
30 Banden in der Groflenordnung 53kD, 22kD und llkD. 
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Fig.l zeigt dabei ein Westernblotting eines 12,5%iges Polyacrylamidgels, 
nach Auflrennung von Alternaria alternata Proteinextrakt; Inkubation mit Sera 
verschiedener Patienten; Detektion mit 125 I- markiertem anti human IgE. 

5 b) Konstruktion der cDNA Expressionsbank 

Gesamt RNA wurde nach der sauren Guanidium-Phenol-Extraktionsmethode 
aus selbst gezuchtetem Pilzmaterial gewonnen. poly(A)plus Anreicherung erfolgte 
mit Oligo(dT) Cellulose der Firma BQhringer. Die cDNA Synthese (1. und 2. 
Strang) wurde durchgefuhrt, wie im Manual des Lambda ZAP-Systems der Firma 
Stratagene beschrieben. Die cDNA wurde anschlieflend (3 1 - seitig) mit EcoRI und 
10 (S'-seitig) mit Xbal Linkern versehen, in vorverdaute Lambda-ZAP-Arme ligiert 
und verpackt Der Titer der Primarbank betrug 900000 Klone. 

c) Screening der cDNA Genbank mit Patientensera, in vivo Excision, Sequenzierung 

Das Screenen der Expressionsbank erfolgte mittels Inkubation der "gelifteten" 
Phagenplaques mit einem Seragemisch aus 2 Patienten, von denen man durch das 

15 Westernblotting wuflte, dafi sie das Spektrum der detektierten Antigene abdecken. 
Die Detektion erfolgte wieder mit anti human IgE RAST Antikorper der Firma 
Pharmacia. Nach Sekundar- und Tertiarscreening blieben 150 positive Klone ubrig. 
Aus 12 Klonen wurde mit Hilfe eines Helferphagen der bereits fertig sequenzierbare 
Bluescriptvektor mit cDNA exzisiert (Durchfiihrung wie im Manual des Lambda 
ZAP-Kits). Restriktionsverdaue der exzisierten Plasmide zeigten (EcoRI-Xbal 

20 Doppelverdaue) 3 verschiedene Inserttypen. Diese 3 Klone wurden nach der 
Sangermethode (Sanger 1977) sequenziert. 

d) Expression der Alta53, Alta22 und Altai 1 cDNAs als 
B-Galaktosidasefusionsprotein 

Mit Hilfe des vorher beschriebenen IgE-Screenings konnten 3 vollstandige 
25 cDNA-Klone erhalten werden. Die jeweiligen rekombinanten Plasmide wurden in 
den Rcoli Stamm XLl-Blue transformiert und mit IPTG 
(isopropyl-fl-D-thiogalactopyranosid) induziert. Der E.coli Gesamtproteinextrakt 
wurde anschlieflend elektrophoretisch aufgetrennt und auf Nitrozellulose geblottet. 
Das Fusionsprotein wurde mittels Serum IgE von Pilzallergikern und einem 
jodmarkiertem Kaninchen anti human IgE Antikorper (Pharmacia, Uppsala 
30 Schweden) detektiert. 
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Die nachfolgenden zwei Figuren zeigen die rekombinanten 
J5-Galaktosidasefusionsproteine nach Inkubation mit Patientenserum und Detektion 
mit jodmarkiertem anti-human IgE. Der B-Galaktosidaseanteil des Fusionsproteins 
betragt 36 Aminosauren, was einem Molekulargewicht von 3800 Dalton 
gleichkommt. Unter Berucksichtigung dieser "Vergroflerung" des allergenen Proteins 
5 sind auch die nachfolgenden Figuren 3 und 4 zu sehen. Spuren (Klone) 1,2,4,5,6,7 
zeigen das rekombinante Fusionsprotein Altai 1, Spuren 3 und 12 zeigen das 
rekombinante Fusionsprotein Alta22 und Spuren 8 und 10 das urn den Fusionsanteil 
grSfler gewordene rekombinante Alta53. 

Fig.2 und 3 zeigen somit eine Expression der rekombinanten Protine Alta52, 
Alta22 und Altai 1 in Bluescript nach IPTG Induktion. 

10 

e) Bestimmung von B- und T-Zell Epitopen bei den rekombinanten Allergenen 

Die abgeleitete Aminosauresequenz der Allergene bietet die Voraussetzung 
fur die Vorhersage von B- und T-Zellepitopen mittels geeigneter 
Computerprogramme. Mit diesen Untersuchungen konnen spezifische T- und 
B-Zell-Epitope definiert werden, die die Fahigkeit besitzen, zB. T-Lymphozyten zu 

15 stimulieren und zur Proliferation anzuregen, aber die Zellen (bei genau definierter 
Dosis) auch in einen Zustand der Toleranz bzw. Nicht-Reaktivitat (Anergie) zu 
versetzen (Rothbard et al. 1991). Die bestimmten Epitope werden jeweils bei der 
Beschreibung des rekombinanten Proteins in eigenen Figuren angefuhrt. 

Die Suche nach B-Zellepitopen wurde mit Hilfe des GCG-Programmes 
(Genetics Computer Group) "PROTCALC", das jedoch von der Arbeitsgruppe urn 

20 Prof. Modrow mit wesentlichen Parametern erweitert wurde, durchgefiihrt. Die 
Bestimmung beruht auf einer Abwagung der Parameter Hydrophilitat 
(Kyte-Doolittle), Sekundarstruktur (Chou-Fasman), Oberflachenlokalisation 
(Robson-Garnier) und Flexibilitat, wodurch die Antigenic von Teilpeptiden 
errechnet wird. 

Das Prinzip der T-Zellepitop-Voraussage erfolte im Prinzip nach dem 
25 Algorithmus von Margalit et al. (1987). Das Prinzip besteht in der Suche nach 
amphipathischen Helices laut Primarsequenz des zu bestimmenden Proteins, flankiert 
von hydrophilen Bereichen. Der berechnete Score muB fur relevante T-Zellepitope 
groBer als 10 sein. Bei MHC II assoziierten Peptiden kann kein Konsensus, weder 
der Sequenz noch der Lange des Peptids" nach, wie bei HLA-A2 (human leucocyte 
antigen) (MHC I) assoziierten definiert werden. Bei HLA-A2 assoziierten Peptiden 
30 betragt die Lange des Peptids 10 Aminosauren, wobei die 2. Aminosaure ein Tyrosin 
und die letzte Aminosaure ein Leucin darstellt (Rammensee et al. 1993). Die 
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berechneten Epitope werden bei der Beschreibung der einzelnen allergenen 
Sequenzen getrennt angefuhrt. 

Molekulare Charakterisierung der klonierten Pilzallergene (Sequenzprotokolle) 

5 Im folgenden werden nun die cDNA Sequenzen und die mit ihnen 
durchgefuhrten Analysen der Reihe nach angefuhrt. Die Computerauswertung der 
nachfolgenden Sequenzen wurden auf einer Ultrix-DEC 5000 Workstation unter 
Zuhilfename des GCG-Softwarepaketes (=Wisconsin Paket: die Algorithmen dieses 
Paketes wurden von der "University of Wisconsin" entwickelt) durchgefiihrt. 

10 A. Alta53 

Die nachfolgende Sequenz 1 zeigt die vollstandige cDNA-Sequenz von Alta53 
beginnend mit dem Start-ATG. Die Lange der cDNA betragt 1488bp, was einem 
berechneten Molekulargewicht von 53543 Dalton entspricht. Die beobachtete Bande 
im Westernblot bei 53kD korreliert somit dem Molekulargewicht nach mit dem 
klonierten und sequenzierten Allergen. Dem reifen Protein durfte nach bisheriger 
15 Analyse kein Signalpeptid voranstehen. 

Sequenz 1: Alta53 = ALDH_alt -> 1-phasen Translation 53543 Dalton 
(1) ANGABEN ZU SEQ ID NO:l 

20 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1488 Basenpaare / 496 Aminosaurereste 

(B) ART: Nukleinsaure / Protein 

(C) STRANGFORM: ds 

(D) TOPOLOGIE: linear 

25 (ii) ART DES MOLEKULS: cDNA zu mRNA / Protein 
(iii) HYPOTHETISCH: nein 
fiv) ANTISENSE: nein 

(v) ART DES FRAGMENTS: Gesamtsequenz 

(vi) URSPRUNGLICHE HERKUNFT: 
(A) ORGANISMUS: Alternaria alternans 

3Q (C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

DNA sequence 1488 b.p. ATGACATCTGTA ... CTGTTCGGTTAA linear 
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AAT 


GAG 


TTC GTA 


AAG 


GCT GTT 


phe lie 


asn 


asn 


glu 


phe val 


lys 


ala val 


122 / 


41 












TCC ACT 


GAG 


GAG 


GTC 


ATC TGC 


AGT 


GTT CAG 


set thr 


glu 


glu 


val 


lie cys 


ser 


val gin 


iei / 


61 










£ GTT GCT 


GCC 


GCC 


CGC 


AAA GCC 


TTC 


AAC GGC 


3 val ala 


ala 


ala 


arg 


lys ala 


phe 


asn gly 


241 / 


Bl 










OGA AAG 


CTG 


CTT 


AAC 


AAG CTT 


GCC 


GAT CTG 


gly lys 


leu 


leu 


asn 


lys leu 


ala 


asp leu 


301 / 


101 












GTC GAG 


GCT 


CTC 


GAC 


AAC GGC 


AAG 


GCC TTC 


val glu 


ala 


leu 


asp 


asn gly 


lys 


ala phe 


361 / 


122 












GCC GCT 


GGT 


TGC 


CTG 


AGG TAC 


TAC 


GGA GGA 


ala ala 


gly 


cys 


leu 


arg tyr 


tyr 


gly gly 


422 / 


141 












J-V/ asp thr 


GCA 


CCC 


GAC 


AGC TTC 


AAC 


TAC ATC 


ala 


pro 


asp 


ser phe 


asn 


tyr ile 


481 / 


161 










TCA TCC 


ATG 


GAA 


CTT 


CCT ATT 


CTC 


ATG TGG 


•er ser 


met 


glu 


leu 


pro ile 


leu 


met trp 


541 / 


161 










GGT AAC 


ACC 


GTC 


GTC 


CTG AAG 


ACT 


GCT GAG 


gly asn 


thr 


val 


val 


leu lys 


thr 


ala glu 


601 / 


201 










AAG CTG 


ATC 


CAG 


GAG 


GCC GGT 


TTC 


CCA CCA 


lys leu 


lie 


gin 


glu 


ala gly 


phe 


pro pro 


661 / 


222 












AAG ATC 
15 lys lie 


GCC 


GGT 


GCT 


GCC ATG 


TCC 


GCT CAC 


ala 


gly 


ala 


ala net 


ser 


ala his 


722 / 


241 












TCA ACC 


GTT 


GTC 


GGC 


CGT CAA 


ATC 


ATG AAG 


ser thr 


val 


val 


gly 


arg gin 


ile 


met lys 


7B1 / 


261 










ACT CTT 


GAG 


CTC 


GGA 


GGC AAG 


AGC 


CCC AAC 


thr leu 


glu 


leu 


gly 


gly lys 


ser 


pro asn 


841 / 


261 












GCT ATC 


CAC 


TGG 


GTC 


AAC TTT 


GGT 


ATT TAC 


ala He 


his 


trp 


val 


asn phe 


gly 


ile tyr 


901 / 


301 












TCG CGT 
ZU »er arg 


ATC 


TAC 


GTC 


CAA GAA 


GAG 


ATC TAC 


lie 


tyr 


val 


gin glu 


glu 


ile tyr 


961 / 


322 












GCT GCT 


CAG 


AAC 


GCT 


GTT GGT 


GAC 


CCA TTC 


ala ala 


gin 


asn 


ala 


val gly 


asp 


pro phe 


1022 / 


341 










GAG CTC 


CAG 


TTC 


GAC 


CGT ATC 


ATG 


GGC TAC 


gin leu 


gin 


phe 


asp 


arg lie 


met 


gly tyr 


10B1 / 


361 












ATC GAG 


ACT 


GGT 


GGC 


AAC CGT 


AAG 


GGT GAC 


He glu 


thr 


gly 


gly 


asn arg 


lys 


gly asp 


1141 / 


381 












TCC AAC 


GTA 


ACC 


GAG 


GAC ATG 


AAG 


ATT CAG 


25 * er asn 


val 


thr 


glu 


asp met 


lys 


ile gin 


1201 / 


401 










ATC TCC 


AAG 


TTC 


AAG 


ACA AAG 


GCC 


GAC GTC 


lie ser 


lys 


phe 


lys 


thr lys 


ala 


asp val 


1261 / 


422 










Ctt tcG 


GCC 


GCT 


GTA 


CAC ACA 


TCC 


AAC CTC 


leu ser 


ala 


ala 


val 


his thr 


ser 


asn leu 


1322 / 


441 














GGA 


ACT 


GTC 


TGG GTC 


AAC 


TCC TAC 


arg ala 


gly 


thr 


val 


trp val 


asn 


ser tyr 


1361 / 


461 










GGG TAC 


AAG 


GAG 


TCT 


GGT ATT 


GGG 


CGC GAG 


30 fliy tyr 


lys 


glu 


ser 


gly lie 


gly 


arg glu 


1441 / 


461 












CAG ACC 


AAG 


ACC 


GTG 


TCT ATT 


CGT 


CTT GGC 


gin thr 


lys 


thr 


val 


ser ile 


arg 


leu gly 



31 / 11 

ACG GGC GAG TTC GAG CAG CCC ACC GGA CTC 
thr gly glu phe glu gin pro thr gly leu 
91 / 31 

GAC GGC AAG ACC TTT GAT GTT ATC AAC CCC 
asp gly lys thr phe asp val ile asn pro 
151 / 51 

GAG GCC ACC GAG AAG GAT GTT GAC ATT GCT 
glu ala thr glu lys asp val asp ile ala 
221 / 71 

CCA TGG gcA AAG GAG ACA CCA GAG AAC AGG 
pro trp ala lys glu thr pro glu asn arg 
271 / 91 

TTC GAG AAG AAT GCC GAC CTC ATT GCT GCT 
phe glu lys asn ala asp leu lie ala ala 
331 / 111 

AGC ATG GCC AAG AAC GTC GAT GTT CCC GCC 
ser met ala lys asn val asp val pro ala 
391 / 131 

TGG GCC GAC AAG ATT GAG GGC AAG GTC GTC 
trp ala asp lys ile glu gly lys val val 
451 / 151 

CGC AAG AGC CTA TTG GTG TTT GCG GTC AGA 

arg lys ser leu leu val phe ala val arg 
511 / 171 

TCA TGG AAG ATT GGT CCT GCC ATC GCC ACT 
ser trp lys ile gly pro ala ile ala thr 
571 / 191 

CAG ACA CCT CTC TCC GCA TAC ATT GCC TGC 
gin thr pro leu ser ala tyr ile ala cys 
631 / 221 

GGT GTC ATC AAC GTC ATC ACT GGT TTC GGA 
gly val ile asn val ile thr gly phe gly 
691 / 231 

ATG GAC ATT GAC AAG ATT GCC TTT ACT GGT 
met asp ile asp lys ile ala phe thr gly 
751 / 251 

TCT GCe GCT GGC TCC AAC TTG AAG AAG GTC 
ser ala ala gly ser asn leu lys lys val 
811 / 271 

ATT GTC TTC GCC GAC GCA GAT CTT GAC GAG 
ile val phe ala asp ala asp leu asp glu 
871 / 291 

TTC AAC CAC GGA CAG GCT TGT TGT GCT GGT 
phe asn his gly gin ala cys cys ala gly 
931 / 311 

GAC AAG TTC ATC CAG CGC TTC AAG GAG CGG 
asp lys phe ile gin arg phe lys glu arg 
991 / 331 

GCC GCG ACA CTC CAG GGT CCT CAA GTC TCG 
ala ala thr leu gin gly pro gin val ser 
1051 / 351 

ATC GAG GAG GGC AAG AAG TCT GGC GCG ACC 
ile glu glu gly lys lys ser gly ala thr 
1111 / 371 

AAG GGT TAC TTC ATC GAG CCC ACA ATC TTC 
lys gly tyr phe ile glu pro thr ile phe 
1171 / 391 

CAA GAA GAG ATC TTC GGC CCC GTC TGC ACA 
gin glu glu ile phe gly pro val cys thr 
1231 / 411 

ATC AAG ATT GGC AAC AAC ACC ACA TAC GGT 
ile lys ile gly asn asn thr thr tyr gly 
1291 / 431 

ACC ACT GCC ATC GAA GTT GCC AAC GCG CTC 
thr thr ala ile glu val ala asn ala leu 
1351 / 451 

AAC ACT CTT CAC TGG CAG CTT CCC TTC GGA 
asn thr leu his trp gin leu pro phe gly 
1411 / 471 

TTG GGA GAG GCG GCG CTG GAC AAC TAC ATC 
leu gly glu ala ala leu asp asn tyr ile 
1471 / 491 

GAT GTT CTG TTC GGT TAA 
asp val leu phe gly OCH 
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Homologiesuchen mit Alta53 in der SWISSPROT-Proteindatenbank ergaben, 
daB es sich bei Alta53, wie auch bei Clah53, urn eine Aldehyddehydrogenase handelt 
, Als Beweis der hohen Homologie (uber viele Strecken handelt es sich um 
Identitaten) zeigt die folgende Sequenz 2 ein paarweises Alignment zwischen Alta53 
und Qah53. Die Identitat (identische Aminosauren) der beiden Proteine (Allergene) 
5 untereinander betragt 78%. Der Homologiegrad (Identitaten plus homologe 
Aminosaureaustausche) liegt sogar bei 86%. 



Sequenz 2: ALDH 

10 1 MTSVKLSTPQTGEFEQPTGLFINNEFVKAVDGKTFDVTNPSTEEVICSVQ 50 

II II- I- t I:- I- :| I I II I I III MM; : I I I I I I I I I I . I . I I . |: 
1 MTSVQLETPHSGKYEQPTGLFINNEFVKGQEGKTFDVINPSDESVITQVH 50 

51 EATEKDVD I AVAAARKAFNGPWAKETPENRGKLLNKLADLFEKNADLI AA 100 

111111111111111. 11:1. I IMIMIMI I- II: I MM. M: II 
51 EATEKDVD I AVAAARQAFEGSWIUiETPENRGKLLNNIJVNLFEKNTDLIiAA 100 

101 VEALDKGRAFSMAEKVDVPAAAGCIAYYGGWADKXEGKVVDTAPD S FNY I 150 
IS I I • I I I I I I III: I . :* I * I I I I I I I I I I I I I - I I I : I I . I I * I I I : 

101 VESLDNGKATSMAR . VTS ACASGCLRYYGGWADKITGKVTDTTPDTFNYV 149 

151 RK. SLLVFAVRSSMELPII2WSWKIGPAIATGNTVVLKTAEQTPLSAYIA 199 

t I ■ - I I : I I I : I 1 I . I I I I I I I I . 1 I I I I I I I I I I I I I I 

150 KKEPIGVCRSDHSLELPLLMWAWKIGPAIACGNTVVLKTAEQTPLGGLVA 199 

200 CKLIQEAGFPPGVINVITGFGKIAGAAMSAHMD1DK1AFTGSTVVGRQIM 249 
. * I : • I I I I I I I I I I I I . I I I I : I I I I : I - I I I : I I : I I I I I I I I I I I : 
2Q 200 ASLVKEAGFPPGVINVI S GFGKVAGAALS SBMDVDKVAFTG5 TWGRTI L 249 

250 KSAAGSNLKKVTLELGGKSPNIVFADADLDEAIHWVNFGI YFNHGQACCA 299 

I • II : II I I I I II I I I I I I I I I I I . I I I : I : I I I I I I I I : I M I I . I I I 
250 KAAAS SNLKXVTLELGGKS PNI VFED AD I DHAI S WVNFGI FFNHGQCCCA 299 

300 GSRI YVQEEI YDKF1QRFKERAAQKAVGDPFAA • TLQGPQVSQLQFDR1M 348 

f I I : I I I I - I I I I I : I : I I I I I .. I - I I I I I II I : I I I I I I .: I I I I I I 
300 GSRVYVQES I YDKFVQKFKERAQKNWGD P FAAD TFQGPQVS KVQFDRIM 349 

25 349 GYIEEGKKS GATIETGGNRKGDKGYFIEPTI FSNVTEDMKIQQEE I FGFV 398 

: I t ■ I I • • I I I II II • I I I I I I I I I I II I I I I I I I I II I • I I I I I I I 
350 EYIQAGKDAGATVETGGSRKGDKGYFIEPTIFSNVTEDMKIVKEEIFGPV 399 

399 CTISKFKTKADVTKIGKOTTYGLSAAVHTSKLTTAIEVANALRAGTVWW 448 
l-l.l I I I I. I. I 1:1 I.. I I I l-l II II- I I- I III I- I I I: I II II I I 

400 CSIARFRTKEDAIKLGKASTYGXAAAVHTKNLNTAIEVS 449 

449 SYNTI^WQLPFGGYKESGIGRELGEAALDNYIQTKTVSIRLGDVXFGZ 496 
30 .HIM | || | M || | | | | || | | | . | | . | | . | | | | | | | | | | | . | | | | 

450 TYNTLHHQMPFGG YKE SGI GRELGED ALANYTQTKTVS IRLGDALFG Z 497 
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Die NAD-abhangige ALDH ist das Hauptenzym, das an der Oxidation von 
Azetaldehyd, einem Primarprodukt des Alkoholmetabolismus, im Menschen beteiligt 
ist. Isoenzyme sind hierbei oft zu finden (Harada et al. 1982). Beim Menschen z.B. 
5 findet man das Isoenzym ALDH I in Mitochondrien, ALDH II im Zytoplasma. 
Interessanterweise ist die Abwesenheit von ALDH I bei Asiaten keine Seltenheit 
(Harada et al. 1982). Die Defizienz von ALDH I resultiert in einem hohen Spiegel 
von Acetaldehyd, was sich als sogenanntes "flushing syndrome", sowie anderen 
vasomotorischen Symptomen nach Alkoholgenufl bemerkbar macht. Der 
Isoenzymverlust lafit sich auf eine Mutation zuriickfuhren, die das native Protein in 
10 seiner Struktur verandert (Hsu et al. 1987). Der Zusammenhang zwischen ALDH 
und Allergieauslosung ist zum Zeitpunkt noch nicht bekannt. 

Die nachfolgende Sequenz 3 zeigt die mit Computersuche identifizierten 
Bereiche mit hohem, antigenen Index. Diese Bereiche stellen hochpotente 
25 B-Zellepitope dar. 

Sequenz 3: Alta53 = ALDH_alt: B-Zellepitope 
(1) ANGABEN ZU SEQ ID NO:3 

20 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: einzeln angefiihrt 

(B) ART: Protein 

(ii) ART DES MOLEKULS: Peptide 
(Hi) HYPOTHETISCH: nein 

25 (v) ART DES FRAGMENTS: N-Terminus bis C-Terminus 
(vi) URSPRUNGLICHE HERKUNFT: 
(A) ORGANISMUS: Alternaria alternans 

(C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

Val Lys Leu Ser Thr Pro Gin Thr Gly Glu Phe Glu Gin Pro Thr Gly 

30 (4 ~ 19) 

Ala Val Asp Gly Lys Thr Phe (29-35) 
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He Asn Pro Ser Thr Glu Glu (38-44) 

Gly Pro Trp Ala Lys Glu Thr Pro Glu Asn Arg Gly Lys Leu Leu Asn 
(70-85) 

Leu Arg Tyr Tyr Gly Gly Trp Ala Asp Lys He Glu Gly (125-137) 
Asp Thr Ala Pro Asp Ser Phe Asn Tyr He Arg Lys Ser (141-153) 
5 Glu Ala Gly Phe Pro Pro Gly Val (205-212) 
Gly Ser Asn Leu Lys Lys Val Thr Leu (254-262) 
Glu Leu Gly Gly Lys Ser Pro Asn He (263-271) 
Tyr He Glu Glu Gly Lys Lys Ser Gly Ala Thr (350-360) 
He Glu Thr Gly Gly Asn Arg Lys Gly Asp Lys Gly Tyr Phe He Glu 
(361-376) 

10 He Gly Asn Asn Thr Thr Tyr Gly (413-420) 
Ala Val His Thr Ser Asn Leu Thr (424-431) 



Die nachfolgende Sequenz 4 zeigt die mit Hilfe des Computerprogrammes 
bestimmten amphipathischen Helices, die von hydrophilen Bereichen flankiert 
werden. Solche Bereiche, mit einem Score hoher als 10, stellen mogliche 
T-Zellepitope dar. 



Sequenz 4: Vorausgesagte amphipathatische Segmente 
T-Zellepitope 

20 EFEQ 

FVKAVD 

KTFDVT 

KAFNGPWA 

KLLNKLADLFE 

IAAVEALDNGKA 

MAKNVDVP 
25 AAGCLRYYGGWADKIEGK 

VDTAPDSFNY 

GVINVITGFGKI 

IYDKFIQRFKERAA 

NAVGDPFAAT 

QFDRIMGYI 

GPVCTI 

AIEVANALR 
30 RELGEAALD 
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(1) ANGABEN ZU SEQ ID NO:4 

(i) SEQUENZKENNZEICHEN: 
(A) LANGE: einzeln angefiihrt 

5 (B) ART: Protein 

(ii) ART DES MOLEKULS: Peptide 

(iii) HYPOTHETISCH: nein 

(v) ART DES FRAGMENTS: N-Terminus bis C-Terminus 

(vi) URSPRUNGLICHE HERKUNFT: 
(A) ORGANISMUS: Altemaria alternans 

10 (C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

Glu Phe Glu Gin (11-16) 
Phe Val Lys Ala Val Asp (26-31) 
Lys Thr Phe Asp Val He (33-38) 
Lys Ala Phe Asn Gly Pro Trp Ala (66-73) 
15 Lys Leu Leu Asn Lys Leu Ala Asp Leu Phe Glu (82-92) 

He Ala Ala Val Glu Ala Leu Asp Asn Gly Lys Ala (98-109) 
Met Ala Lys Asn Val Asp Val Pro (112-119) 

Ala Ala Gly Cys Leu Arg Tyr Tyr Gly Gly Trp Ala Asp Lys He Glu Gly 
Lys (121-138) 

Val Asp Thr Ala Pro Asp Ser Phe Asn Tyr (140-149) 
20 Gly Val He Asn Val He Thr Gly Phe Gly Lys He (211-222) 

He Tyr Asp Lys Phe He Gin Arg Phe Lys Glu Arg Ala Ala (309-322) 

Asn Ala Val Gly Asp Pro Phe Ala Ala Thr (324-333) 

Gin Phe Asp Arg He Met Gly Tyr He (343-351) 

Gly Pro Val Cys Thr He (396-401) 

Ala He Glu Val Ala Asn Ala Leu Arg (433-441) 
25 Arg Glu Leu Gly Glu Ala Ala Leu Asp (469-477) 

Die T-Zellepitope errechnen sich aus den Aminosaurepositionen der 
Midpoints, die N-terminal von einem Lysin (K), C-terminal von einem Prolin (P) 
flankiert werden (=Flags). Es sind nur dann potentielle T-Zellepitope vorhanden, 
wenn der "Score-Index" grofler als 10 ist. 



30 
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B. Altai 1 

Die folgende Sequenz 5 zeigt die vollstandige cDNA-Sequenz von Altai 1 und der 
von ihr abgeleiteten Aminosaufesequenz. Der offene Leserahmen umfaflt 342bp bzw. 
114 Aminosauren. Das berechnete Molekulargewicht bertagt 11127 Dalton und 
5 entspricht somit dem llkD groBen antigenen Protein, das im Westernblot von 10,3% 
der Patienten erkannt wird. 

Sequenz 5: Altai 1 =rla2_alt - > 1-phasen Translation 11127 Dalton 
(1) ANGABEN ZU SEQ ID NO:5 

10 (i) SEQUENZKENNZEICHEN: 

(A) LANGE: 342 Basenpaare / 1 14 Aminosaurereste 

(B) ART: Nukleinsaure / Protein 

(C) STRANGFORM: ds 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: cDNA zu mRNA / Protein 
15 (Hi) HYPOTHETISCH: nein 

(iv) ANTISENSE: nein 

(v) ART DES FRAGMENTS: Gesamtsequenz 

(vi) URSPRtfNGLICHE HERKUNFT: 
(A) ORGANISMUS: Alternaria altemans 

(C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

20 

DNA Sequenz 342 b.p. ATGAAGCACCTC ... CTCTTCGACTAA linear 



25 



1 


/ 


1 
















31 


/ 


11 










ATG 


AAG 


CAC 


CTC 


GCG 


GCA 


TAG 


CTC 


CTC 


CTC 


GGC 


CTT 


GGT 


GGC 


AAC ACC TCG 


CCC 


TCC GCT 


net 


lys 


Ms 


leu 


ala 


ala 


tyr 


leu 


leu 


leu 


gly 


leu 


gly 


gly 


asn thr ser 


pro 


ser ala 


61 


/ 


22 
















91 


/ 


31 










GCC 


GAC 


GTC 


AAG 


GCC 


GTC 


CTT 


GAG 


TCC 


GTT 


GGT 


ATC 


GAG 


GCT 


GAC TCC GAC 


CGT 


CTT GAC 


ala 


asp 


val 


lys 


ala 


val 


leu 


glu 


ser 


val 


gly 


lie 


glu 


ala 


asp ser asp 


arg 


leu asp 


122 


/ 


41 
















151 


/ 


51 










AAG 


CTG 


ATC 


TCC 


GAG 


CTT 


GAG 


GGC 


AAG 


GAC 


ATC 


AAC 


GAG 


CTC 


ATC GCT TCC 


GGT 


TCC GAG 


lys 


leu 


lie 


ser 


glu 


leu 


glu 


gly 


lys 


asp 


lie 


asn 


glu 


leu 


lie ala ser 


gly 


ser glu 


iei 


/ 


61 
















221 


/ 


71 










AAG 


CTT 


GCT 


TCC 


GTT 


CCC 


TCC 


GGT 


GGT 


GCC 


GgT 


GGT 


GCT 


GCC 


GCT TCC GGT 


GGT 


GCT GCT 


lys 


leu 


ala 


ser 


val 


pro 


ser 


gly 


giy 


ala 


gly 


gly 


ala 


ala 


ala ser gly 


gly 


ala ala 


241 


/ 


81 
















271 


/ 


91 










GCC 


GCT 


GGT 


GGC 


TCC 


GCT 


GAG 


GCT 


GAG 


GcC 


GCT 


CCT 


GAG 


GCc 


GCC AAG GAG 


GAG 


GAG AAG 


ala 


ala 


gly 


gly 


ser 


ala 


gin 


ala 


glu 


ala 


ala 


pro 


glu 


ala 


ala lys glu 


glu 


glu lys 


301 


/ 


101 
















331 


/ 


111 










GAG 


GAG 


TCT 


GAC 


GAG 


GAC 


ATG 


GGT 


TTC 


GGT 


CTC 


TTC 


GAC 


TAA 








glu 


glu 


ser 


asp 


glu 


asp 


met 


gly 


phe 


gly 


leu 


phe 


asp 


OCH 









Homologiesuchen in der SWISSPROT-Proteindatenbank ergaben hier 
Homologien zum ribosomalen Protein P2. Dieses ribosomale Protein ist an der 
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Bildung der groflen Untereinheit der Ribosomen beteiligt. Somit ist auch 
zwangslaufig eine Homologie zu Clahll, dem Gegenstuck von Altai 1 in 
Cladosporium herbarum, vorhanden. Die Identitaten und Homologien zwischen 
Altai 1 und Clahll werden aus der folgenden Sequenz 6 heraus ersichtlich. Die » 
Identitat der beiden Proteine liegt bei 74%, der Homologiegrad wachst auf 84%, was 
zweifelsohne auf eine ahnliche Funktion dieser beiden Proteine hinweist. » 



Sequenz 6: 
rla2_alt x rla2_clado 

10 

• • > * » 

1 MKHLAAYLLLGLGGNTSPSAADVKAVLESVGIEADSDRLDKLISELEGKD 50 

M-llhlllll I M I I I. I: I. II. MM :M.:. : MMIMM 
1 MKYLAAFLLLGL.GNSSPSAEDIKTVLSSVGIDADEEPSQLLLKELEGKD 49 

51 INELI AS GSEKIAS VPS GGAGGAAAS GGAAAAGGS AQAEAAPEAAKEEEK 100 

DIMM I II II II I I I I I ||:|. |:|:M I: I |.| I . I | . | 

50 INELI S S GSEKLASVPS GGAGAAS AGGAAAAGG AEEKAEEEKK 92 

15 

101 EESDEDMGFGLFDZ 114 
MlhlMIIMM 
93 EESDDDMGFGLFD2 106 

Saure ribosomale Proteine (wie PO, PI und P2) von verschiedenen 
Organismen wurden mit einer Vielzahl von Techniken analysiert.Man unterscheidet 
A-Proteine (acidic) oder P-Proteine (phosphorylierte A-Proteine). Ein Merkmal der 
A-Proteine sind die grofle Zahl hydrophober Aminosauren. Sie konnen deshalb 
relativ leicht vom Ribosom dissoziiert werden (50% Ethanol und hohe 
Salzkonzentration). Das am besten charakterisierte A-Protein in Prokaryonten ist das 
L7/L12 Protein von Escherichia coli. Die eukaryontischen Homologen sind die- 
Proteine PI und P2, die wie auch das L7/L12 Protein mit dem Elongationsfaktor 
EF1 und EF2 interagiert Die C-terminale Sequenz beinhaltet ein Epitop, das von 
Autoantikorpern von Lupus-patienten erkannt wird (Francoeur et ah 1985, Rich et 
al. 1987 , Hines et el. 1991). Das P2 Protein entspricht in seiner Homologie dem 
allergenen Protein Altai 1 . 

Die gezeigten B-Zellepitope in der nachsten Sequenz 7 sind unter 
Beriicksichtigung von Sekundarstruktur, Oberflachenlage, Hydrophilitat, Flexibilitat 
etc. berechnet worden. 
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Sequenz 7: Altai l=rla2_alt: B-Zellepitope 
(1) ANGABEN ZU SEQ ID NO:7 

(i) SEQUENZKENNZEICHEN: 
5 (A) LANGE: einzeln angefuhrt 

(B) ART: Protein 

(ii) ART DES MOLEKULS: Peptide 

(iii) HYPOTHETISCH: nein 

(v) ART DES FRAGMENTS: N-Terminus bis C-Terminus 

(vi) URSPRUNGLICHE HERKUNFT: 
10 (A) ORGANTSMUS: Alternaria alternans 

(Q ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

Leu oly Gly Asn The Ser Pro Ser Ala Ala Asp (12-22) 
lie Olu Ala Asp Ser Asp Arg Leu Asp Lys Leu lie Ser (32-44) 
Glu Leu Glu Gly Lys Asp He Asn Glu Leu (45-54) 
15 Ala Ser Gly ser Glu Lys Leu Ala ser (56-64) 

Pro Glu Ala Ala Lys Glu Glu Glu Lys Glu Glu Ser Asp Glu Asp Met Gly Phe (92-109) 

Die folgende Sequenz 8 zeigt die berechneten T-Zellepitope und stellt die 
Aminosauren im 1-Lettercode dar. 

20 Sequenz 8: Vorausgesagte amphipathatische Segment© 
T-Zellepitope 

RLDKLISELEGKDINELIASG 
EKLASVPSGG 

25 (1) ANGABEN ZU SEQ ID NO: 8 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: einzeln angefuhrt 

(B) ART: Protein 

(ii) ART DES MOLEKULS: Peptide 
30 (iii) HYPOTHETISCH: nein 

(v) ART DES FRAGMENTS: N-Terminus bis C-Terminus 
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(vi) URSPRUNGLICHE HERKUNFT: 

(A) ORGANISMUS: Alternaria alternans 

(C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

Arg Leu Asp Lys Leu lie Ser Glu Leu Glu Gly Lys Asp lie Asn Glu Leu lie Ala Ser Gly 
(38-56) 

^ Glu Lys Leu Ala Ser Val Pro Ser Gly Gly (60-69) 

Die T-Zellepitope errechnen sich aus den Aminosaurepositionen der 
Midpoints, die N- terminal von einem Lysin (K), C-terminal von einem Prolin (P) 
flankiert werden (=Flags). Es sind nur dann potentielle T-Zellepitope vorhanden, 
wenn der "Score-Index" groiter als 10 ist. 

10 



C. Alta22 

Die nachfolgende Sequenz 9 zeigt die vollstandige cDNA Sequenz von 
j 5 Alta22. Die daraus abgeleitete Protein Primarsequenz ist ebenfalls aus der Sequenz 
ersichtlich. Der offene Leserahmen des allergenen Proteins betragt 615bp, was einer 
Aminosaurelange von 205 Aminosauren entspricht. Das errechnete Molekulargewicht 
des rekombinanten Proteins betragt 2204 J Dalton. Laut bisheriger Analyse steht dem 
reifen Protein keine Signalseqenz voran. 

Sequenz 9: YCP4 alt -> 1-phasen Translation 22041 Dalton 
20 ~ 

(1) ANGABEN ZU SEQ ID NO:9 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 615 Basenpaare / 205 Aminosaurereste 

(B) ART: Nukleinsaure / Protein 
25 (C) STRANGFORM: ds 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: cDNA zu mRNA / Protein 

(iii) HYPOTHETISCH; nein 

(iv) ANTISENSE: nein 

(v) ART DES FRAGMENTS: Gesamtsequenz 
30 (vi) URSPRUNGLICHE HERKUNFT: 

(A) ORGANISMUS: Alternaria alternans 
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(A) ORGANISMUS: Alternaria alternans 
(C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

DNA sequence 615 b.p. ATGGCTCCCAAG ... GCGCATCAGTGA linear 

1 / 1 31/11 
- ATG GCT CCC AAO ATC GCG ATT CTG TAC TAG TCC ATG TAG GCC CAC ATC AAO AAO ATG GCC 
J act ala pro lys lie ala lie val tyr tyr ser met tyr gly his ile lys lys met ala 

61 / 22 91 / 31 

GAT GCT GAG TTG AAG GGT ATC CAA GAG GCT GGC GGT GAT GCC AAG CTC TTC CAA GTC GCC 
asp ala glu leu lys gly ile gin glu ala gly gly asp ala lys leu phe gin val ala 
122 / 41 1 51 / S1 

GAG ACC CTG CCT CAG GAA GTC CTC GAC AAG ATG TAC GCO CCC CCC AAG GAC TCA TCG GTC 
glu thr leu pro gin glu val leu asp lys met tyr ala pro pro lys asp ser ser val 
181 / 61 221 / 71 

CCC GTC CTC GAG GAC CCA GCC GTC CTC GAA GAA TTT GAC GGC ATC CTC TTC GGC ATC CCC 
pro val leu glu asp pro ala val leu glu glu phe asp gly ile leu phe gly ile pro 
241 / 01 271 / 91 

ACC CGC TAC GGC AAC TTC CCC GCA CAA TTC AAG ACC TTC TGG GAC AAO ACA GGC AAG CAA 
1U thr arg tyr gly asn phe pro ala gin phe lys thr phe trp asp lys thr gly lys gin 
301 / 101 331 / in 

TGG CAA CAA GGC GCC TTT TGG GGA AAG TAC GCC GGT GTC TTC GTT TCG ACQ GGC ACC CTG 
trp gin gin gly ala phe trp gly lys tyr ala gly val phe val ser thr gly thr leu 
361 / 122 391 / 131 

GGCGGGT GGC CAG GAG ACG ACT GCC ATT ACC AGC ATG AGC ACQ CTT GTC GAC CAC GGT TTC 
gly gly gly gin glu thr thr ala ile thr ser »et ser thr leu val asp his gly phe 
«2 / "I 451 / 151 

ATC TAC GTT CCC CTT GGC TAC AAG ACT GOG TTT AGC ATG TTG GCC AAC TTG GAC GAG GTC 
ile tyr val pro leu gly tyr lys thr ala phe ser met leu ala asn leu asp glu val 
481 / 161 5U / i7i 

CAC GGT GGA AGC CCA TGG GGT GCT GGT ACC TTC TCT GCC GGC GAT GGA TCG AGO CAG CCC 
15 his gly gly ser pro trp gly ala gly thr phe ser ala gly asp gly ser arg gin pro 
541 / 181 571 / i9i 

ACT GAG CTT GAG CTC AAC ATT GCG CAG GCT CAG GGT AAG GCT TTC TAC GAG GCT GTT GCC 

ser glu leu glu leu asn ile ala gin ala gin gly lys ala phe tyr glu ala val ala 

601/201 

AAG GCG CAT CAG TGA 

lys ala his gin OPA 

Homologiesuchen mit dem sequenzierten Protein in der 
20 SWISSPROT-Proteindatenbank zeigten, dafi das Allergen Alta22 signifikante 
Homologie zu dem Hefeprotein YCP4 aufweist. Die Identitat der beiden Proteine 
betragt 56%, die Homologie steigt sogar auf 72% an. Eine so hohe Ahnlichkeit lafit 
wohl eine gemeinsame Funktion dieser beiden Proteine annehmen. Die nachfolgende 
Sequenz 10 spiegelt die hohe Homologie von Alta22 und YCP4 wieder. 
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Sequenz 10: 
ycp4_alt x ycp4_yeast 



1 MAPKZAIVYYSKyGBIKKKADAEXJCGIQEAGGDAKLFQyASTU^EVIi)K 50 

I- IHI: M INI- MM 
1 HV.KIAI1TYSTYGHIDVIA0AVKKGVEAAGGKADITKVZ2TIOT 49 

51 M¥APPKDSSVFTO^FAVX£EE?>GII^XPTJUrGN7PA^ 100 

30 I 1 1 . 1 . . . : 1 1 : I : : 1 1 1 : 1 1 1 : 1 1 : 1 1 1 : . . 1 1 1 1 1 1 

50 MKAFQKPEDI WATEKTIXE . YDAFLFGVPTRFGNLPAQWSAFWDKTGGl* 98 



101 WQQGAFWGKYAGVFVSTGTLGGGQETTAITSMSTLVDHGFIYVPLGYKTA 150 



WO 95/06122 



18 



PCT/AT94/00121 



I.. I.: II II: 111 I:-. Ill I! . I, .::| I . . | I : I : : I 1 1 I I . • 
99 WAKGSLNCKAAGIFVSTSSYGCCCESTVKACLSYLWIHGIIEXPLaYKNS 148 

151 FSMLAHU)EVHGGSPWGAGTFSAGDGSRQPSEL£X^IAOAQGKAFYB . A . 198 

I. M.:: II II 1 1 II I II |:.:. I III : 1 . 1 1 1 . 1 1 : III. Ill I 
149 FA£IASISEVHGGSFHGAGTXAGPDGSRTA5P1£LRIA£IQGKTFY£TAK 198 

199 . ..VAK AHQZ 205 

.11 |..: 
199 KLFPAKEAXPSTEKKTTTSDAAKRQ 223 

5 



Was ist aber nun die Funktion von YCP4: Die Sequenz, bzw. der offene 
Leserahmen von YCP4, wurde im Rahmen des Hefegenomprojektes am Chromosom 
3 von Saccharomyces cerevisiae lokalisiert und publiziert (Biteau et ah 1992). Eine 

10 Disruption von YCP4 zeigte nach Biteau et al. (1992) keinen Phanotyp. 
Durchgefiihrte verfeinerte Phanotypanalysen deuten aber darauf hin, dafl Hefe YCP4 
eine Funktion als Hitzeschockprotein besitzen konnte. Dieser Versuch zeigt 
nebenbei, wie wichtig Saccharomyces cerevisiae fur die Funktionsanalyse von 
Allergenen sein kann. Die leichte Transformierbarkeit, verbunden mit ausgereiften 
Methoden der Molekulargenetik ermoglichen es, Gene in Hefe zu disruptieren und 

15 den daraus resultierenden Phanotyp zu analysieren. 

Es hat sich auch gezeigt, daB auch Alta22 seinen homologen Partner in 
Cladosporium herbarum besitzt. Die folgende Sequenz 11 zeigt ein "multiple 
sequence alignment" zwischen dem Hefe YCP4 und den Allergenen Alta22 und 
Clah22. 
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Sequenz 11: 



pileup . msf < YCP4_altpro} 
pileup . msf { YCP4_cladopro ) 
pileup. msf (ycp4_yeast) 
Consensus 



1 50 
MAPKIATVYY SmYGHIkkMA DAElKGIqEA GGdAkLFqVa ETLPQEVLdK 
MAPXIAIIFY STWGHVqtIA EAEaKGIrEA GGsvDLYKVp ETLtQEVLTK 
.mvKIAIItY STYGHIdvLA qAvkKGVeaA GGkADiYRVe ETLPdEVLTK 
KIAI — Y S — GH A -A— KG A GO V- ETL — EVL-K 



pileup . msf { YCP4_altpro ) 
25 pileup.msf {YCP4_cladopro} 
pileup. msf (ycp4_yeast} 
Consensus 



51 100 
MyAPPKDsSV FVleDPaVLE eFDgiLFGIP TRYGNFPAQF kTFWDKTGXQ 
MhAPPKDDSI PeiTDPflLE qYDrFphGhP TRYGKFPAQH rTFWDrTGGQ 
MrvAPqKpEtil PVaTEktlLE . YDaFLFGVP TRFGNLPAQW saFWDKTGGl 
M-AP-K P LE — D G-P TR-GH-PAQ FWD-TG— 



pileup . msf { YCP4_al tpro ) 
pil eup . msf < YCP4_cladopr o ) 
pileup . msf {ycp4_yeas t ) 
Consensus 



101 150 

WQqGAFWGKY AGVFVSTGTl GGGQEtTAit sMSTLVdBGf lYVFLGYKTa 
WQtGAFWGKY AGlFISTGTq GGGQESTA1A aMSTLsHHGZ IYVPLGYKTt 
WaXGsLnGKa AGIFVSTssy GGGQESTvkA cLSyLaBBGI IFlPLGYKns 
W--G GK- AG-F-ST™ GGGQE-T S-L—HG- I— PLGYK— 



pileup.msf{YCP4_altpro) 
30 pileu I , ' msf {YCP4_cladopro> 
pileup . msf (ycp4_yeast ) 
Consensus 



151 200 
FsMLAnlDEV HGGSPWGAGT FSaGDGSRQP SeLELnXAqA QGKAFYEAVA 
FhLLgdnsEV rGaavWGAGT FSGGDGSRQP SqkELelt.A QGKAFYEAVA 
FaeLAsiEEV BGGSPHGAGT LaGpDGSRta SpLELrlAei QGXtFYEtaX 
F — L EV -G WGAGT DGSR-- S— EL QGK-FYE ; 
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201 249 

pileup.msf (YCP4_altpro) KahqZ 

pileup . asf { YCP4_cTadopro > Rvmf Qz 

plleup.nsf (ycp4_ycast) Xlfpakeakp stekktttsd aaXrqtkpaa attaekJcedk gllacctvm 
Consensus K— — — — — — — — 



Die mit Computerunterstutzung gefundenen B-Zellepitope sind in der 

> 

S nachsten Sequenz 12 zu sehen. 
Sequenz 12: AIta22=YCP4_aIt: B-Zellepitope 
(1) ANGABEN ZU SEQ ID NO: 12 

(i) SEQUENZKENNZEICHEN: 
^ (A) LANGE: einzeln angefuhrt 

(B) ART: Protein 

(ii) ART DES MOLEKULS: Peptide 

(iii) HYPOTHETISCH: nein 

(v) ART DES FRAGMENTS: N-Terminus bis C-Terminus 

(vi) URSPRUNGLICHE HERKUNFT: 
15 (A) ORGANISMUS: Altemaria alternans 

(C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

Lys Met Tyr Ala Pro Pro Lys Asp Ser Ser Val (50-60) 
He Pro Thr Arg Tyr Oly Asn Phe Pro (79-67) 

Gin Phe Lya Thr Phe Trp Asp Lys Thr Sly Lys Oln Trp Oln Oln oly Ala Phe Trp Oly Lys Tyr 
Ala oly (89-112) 

20 

Gly Thr Leu Gly Oly Oly oln Glu Thr Thr Ala He Thr Ser (118-131) 
Leu Asp Olu val His Oly Gly Ser Pro Trp Oly Ala Oly Thr (157-170) 
Phe Ser Ala Oly Asp Oly Ser Arg Gin Pro Ser Glu Leu Olu Leu (171-185) 

Die nachfolgende Sequenz 13 zeigt die berechneten T-Zellepitope. Amphipathische 
Bereiche mit einem Score geringer als 10 werden als nicht relevant angenommen. 

25 

Sequenz 13:Vorausgesagte amphipathatische Segmente 

T-Zellepitope 

SMYGHIKKMAD 
GIQEA 

LFQVAETLPQEVLDKMYA 
30 AVLEEFDGI 

TRYGNFPAQFKTFWDKTGKQW 
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TAITSMSTL 

FSMLANLDEVHG 

QGKAFYEAVA 

(1) ANGABEN ZU SEQ ID NO: 13 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: einzeln angefuhrt 

(B) ART: Protein 

(ii) ART DES MOLEKULS: Peptide 

(iii) HYPOTHETISCH: nein 

(v) ART DES FRAGMENTS: N-Terminus bis C-Terminus 

(vi) URSPRUNGLICHE HERKUNFT: 
(A) ORGANISMUS: Alternaria altemans 

(C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

Ser Ket Tyr Oly His He Lys Lys Met Ala Asp (11-21) 
Gly He Gin Glu Ala (26-30) 

Leu Phe Gin Val Ala Glu Thr Leu Pro Gin Glu Val Leu Asp Lys Met Tyr Ala (36-53) 
Ala Val Leu Glu Glu Phe Asp Gly He (67-75) 

Thr Arg Tyr Gly Asn Phe Pro Ala Gin Phe Lys Thr Phe Trp Asp Lys Thr Gly Lys Gin Trp 
(81-101) 

i 

Thr Ala He Thr Ser Met Ser Thr Leu (127-135) 

20 

Phe Ser Met Leu Ala Asn Leu Asp Glu Val His Gly (151-162) 
Gin Gly Lys Ala Phe Tyr Glu Ala Val Ala (191-200) 



Die T-Zellepitope errechnen sich aus den Aminosaurepositionen der 
25 Midpoints, die N-terminal von einem Lysin (K), C-terminal von einem Prolin (P) 
flankiert werden (=Flags). Es sind nur dann potentielle T-Zellepitope vorhanden, 
wenn der "Score-Index" grofier als 10 ist. 
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Patentanspriiche 

1. Rekombinante DNA Molekiile, die fur Polypeptide kodieren, die die 
5 Antigenitat der Allergene Alta53, Alta22 und Altai 1 besitzen oder fur Peptide, die 
mindestens ein Epitop dieser Allergene aufweisen, dadurch gekennzeichnet, daB sie 
Nukleinsauresequenzen aufweisen, die mit den Sequenzen 1, 3-5, 7-9, 12 und 13, 
oder mit Teilbereichen dieser Sequenzen in homologer Weise iibereinstimmen, bzw. 
Nucleinsauresequenzen, die mit den genannten Nucleinsauresequenzen unter 
stringenten Bedingungen hybridisieren. 
10 2. Rekombinante DNA-Molekule nach Anspruch 1, dadurch gekennzeichnet, 
daB sie Nukleinsauresequenzen aufweisen, die durch Degeneration aus den 
Sequenzen 1, 3-5, 7-9, 12 und 13 ableitbar sind. 

3. Rekombinante DNA Molekule nach Anspruch 1 oder 2, dadurch 
gekennzeichnet, daB sie Nukleinsauresequenzen aufweisen, die fur Polypeptide 
kodieren, die als Antigene kreuzreaktiv mit den Allergenen Alta53, Alta22 und 

15 Altai 1 sind und zu diesen eine hohe Homologie aufweisen. 

4. Rekombinante DNA-Molekule nach Anspruchen 1 bis 3. dadurch 
gekennzeichnet, dafi sie funktionell mit einer Expressionskontrollsequenz zu einem 
Expressionskonstrukt verbunden sind. 

5. Wirtssystem zur Expression von Polypeptiden, dadurch gekennzeichnet, 
daB es mit einem rekombinanten Expressionskonstrukt nach Anspruch 4 transformiert 

20 ist. 

6. Aus einem DNA-Molekul nach einem der Anspriiche 1 bis 3 abgeleitetes 
rekombinantes oder synthetisches Protein oder Polypeptid, dadurch gekennzeichnet, 
daB es die Antigenitat von Alta53, Alta22 oder Altai 1, oder zumindest von einem 
Epitop dieser Proteine, aufweist. 

7. Rekombinantes oder synthetisches Protein oder ein Polypeptid nach 
25 Anspruch 6, dadurch gekennzeichnet, daB es eine Aminosauresequenz aufweist, die 

den gezeigten Sequenzen 1, 3-5, 7-9, 12 und 13 zur Ganze oder teilweise entspricht. 

8. Rekombinantes oder synthetisches Protein oder Polypeptid nach Anspruch 
6 oder 7, dadurch gekennzeichnet, daB es ein Fusionsprodukt darstellt, das die 
Antigenitat der Allergene Alta53, Alta22 oder Altai 1, oder zumindest eines Epitops 
davon, aufweist und einen zusatzlichen Polypeptidanteil besitzt, wobei das gesamte 

30 Fusionsprodukt von der DNA eines Expressionskonstrukts gemaB Anspruch 4 kodiert 
wird. 
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9. Rekombinantes Oder synthetisches Protein oder Polypeptid nach Anspruch 
8, dadurch gekennzeichnet, dafi der besagte zusatzliche Polypeptidanteil 
B-Galaktosidase oder ein anderes zur Fusion geeignetes Polypeptid ist. 

10. Diagnostisches oder therapeutisches Reagens, dadurch gekennzeichnet, 
dafl es ein synthetisches Protein oder Polypeptid gemaB einem der Anspruche 6 bis 9 

5 enthalt. 

11. Verfahren zum in vitro -Nachweis der Allergie eines Patienten gegen die 
Allergene Alta53, Alta22 oder Altai 1, dadurch gekennzeichnet, dafl die Reaktion 
der IgE Antikorper im Serum des Patienten mit einem rekombinanten oder 
synthetischen Protein oder Polypeptid nach einem der Anpruche 6 bis 9 gemessen 
wird. 

10 12. Verfahren, zum in vitro - Nachweis der zellularen Reaktion auf die 

Allergene Alta53, Alta22 oder Altai 1, dadurch gekennzeichnet, daB ein 
rekombinantes oder synthetisches Protein oder Polypeptid nach einem der Anspruche 
6 bis 9 zur Stimulierung oder Hemmung der zellularen Reaktion eingesetzt wird. 

15 
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1/1 

Fig.l: Westernblotting eines 12,5%iges Polyacrylamtdgels, nach Auftrennung von Alternaria 
alternata Proteinextrakt; Inkubation mit Sera verschiedener Patienten; Detektton mit Jod 
i markiertem anti human IgE. 
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Fig.2 und 3: Expression dcr rckombinanten Protine Alta52, Alta22 und Altai! in Bluescript 
nachlPTGInduktion. 
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